Common Pile v0.1 adalah dataset yang berisi teks berlisensi dan domain terbuka yang digunakan untuk melatih model AI baru. Dataset ini diklaim memiliki kualitas yang cukup untuk bersaing dengan model yang dilatih menggunakan data yang tidak berlisensi.